5  Manipulación de datos no estructurados

5.1 Datos no estructurados

A diferencia de los datos estructurados, estos no poseen una estructura fácilmente visible, ya que este tipo de datos es generado por varias fuentes, siendo en su mayoría texto que incluye información como fechas, números y hechos.

5.2 Diferencia de datos no estructurados con datos estructurados.

Como se mencionó, los datos estructurados no poseen una estructura que sea fácil de identificar, debido a que sus datos en su mayoría cualitativos, que pueden ser muy diferente entre sí, pudiendo ser algoritmos, pensamientos, entre otros, aparte de los simples datos que puedes identificar en los datos estructurados, otro punto por el que se diferencia es la dificultad de usar los datos con un programa informático, siendo todo lo contrario a los datos estructurados, los cuales poseen varios programas que ayudan en su elaboración y estudio.

5.3 Herramientas para análisis no estructurados

5.3.1 En RStudio

Algunos paquetes que podremos usar para la manipulación de datos no estructurados en RStudio son:

  • Tidytext: Es un paquete que permite la manipulación y análisis de datos de texto. Proporcionando herramientas que facilitan la limpieza, transformación y análisis de texto de una manera estructurada y compatible

  • Imager: Paquete utilizado para el procesamiento de imágenes, ayudando en la carga, manipulación, análisis y visualización

  • tuneR: Utilizado para el manejo de datos de audio, brinda funciones para leer, escribir y manipular archivos de audio en varios formatos.

5.3.2 Otras herramientas

  • MongoDB Charts: MongoDB Charts es una herramienta desarrollada por MongoDB, una popular base de datos NoSQL, que se especializa en la visualización de datos. Donde los usuarios tienen la facilidad para generar gráficos y paneles de información de forma sencilla y veloz, todo ello directamente desde los conjuntos de datos alojados en MongoDB.

  • Power BI de Microsoft: Esta plataforma posibilita a los usuarios la visualización y compartición intuitiva y eficiente de sus datos. Su aplicación abarca desde la transformación de datos en bruto hasta la generación de informes interactivos y paneles de control.